Model Selection

High-precision scoring

# High-precision scoring

Fsfairx LLaMA3 RM V0.1

A reward model trained on Meta-Llama-3-8B-Instruct for reward modeling in RLHF processes, supporting PPO, iterative SFT, and iterative DPO methods.

Large Language Model

Cross Encoder Umberto Stsb

Cross-encoder model for Italian sentence similarity calculation based on the Umberto architecture

Transformers Other

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase